Modelado de conceptos enmascarados entre modalidades: MACCO
Descubre MACCO, un innovador marco que mejora la comprensión composicional en modelos visión-lenguaje como CLIP, superando el comportamiento de 'bolsa de palabras'.
Descubre MACCO, un innovador marco que mejora la comprensión composicional en modelos visión-lenguaje como CLIP, superando el comportamiento de 'bolsa de palabras'.
Descubre FIGMA: mejora la recuperación de música con descripciones finas de tempo, tonalidad, progresión. Supera a CLAP en hasta 73%.